服務(wù)熱線:0755-23020893
公司座機:0755-23020893
業(yè)務(wù)直線:13530892758
公司郵箱:yjdsy88@126.com
微信平臺:億金達受控環(huán)境
公司地址:深圳市龍崗區(qū)寶荷大道76號智慧家園1棟B座1702
生產(chǎn)基地:東莞市常平鎮(zhèn)松柏塘村北橫路8號
01
背景介紹
目前的轉(zhuǎn)錄組測序技術(shù)只能獲得群體的遺傳或表達信息,而無法區(qū)分細胞間的差異,單細胞測序技術(shù)可以研究單個細胞或基因的表達情況,從而研究細胞異質(zhì)性,也可以獲得基因表達、剪接等信息以及根據(jù)這些信息構(gòu)建的調(diào)控關(guān)系。因此,在實驗之前要進行合理、細致的實驗設(shè)計,避免一些混雜因素(confounding factors)的影響并基于生物學(xué)的變異得出可靠的結(jié)論,防止批量操作時引入人工產(chǎn)物影響實驗結(jié)果。
本文基于兩種主流的單細胞RNA測序技術(shù):Smart-seq2和10X Genomics 3’ sequencing,討論了單細胞轉(zhuǎn)錄組測序的實驗設(shè)計原則和注意事項,并對兩種方法的優(yōu)缺點進行比較分析。
02
兩種方法:Smart-seq2和10X Genomics 3’sequencing的比較
(1)SMART技術(shù):Smart技術(shù)是基于高保真的反轉(zhuǎn)錄酶、模板轉(zhuǎn)換和前置放大來增加cDNA得率,實驗流程2天,得到的是全長轉(zhuǎn)錄本。該方法有較好的覆蓋范圍,可檢測到稀有轉(zhuǎn)錄本,不需要額外的專業(yè)設(shè)備,因此應(yīng)用范圍較廣。但是該方法不適合大批量實驗(如96甚至384個樣本)。
(2)10X Genomics 3’sequencing :該方法基于微流控技術(shù)(Microfluidics-based approaches),與Smart有相似的分子生物學(xué)原理,運用了模板轉(zhuǎn)換技術(shù),但與Smart的細胞捕獲和通量不同。droplet-based方法是將單個細胞包裹在一個小油滴中(含有barcode和RT primer)反轉(zhuǎn)錄成cDNA,然后油滴破裂釋放cDNA,統(tǒng)一進行文庫構(gòu)建,增大了實驗通量,但需要專門的實驗設(shè)備,如BioRad的ddSeq single-cell isolator(用Illumina Nextera kits);Fluidigm C1 platform的低通量的微流控技術(shù),能在捕獲細胞時可視化的控制empty wells or doublets。但目前最主流的是10X Genomics。
兩種方法的比較如下:
C、D、E:10x data F、G、H:Smart data
(1)從Fig.1A可知,兩種方法最大的區(qū)別是RNA反轉(zhuǎn)錄成cDNA的方法:分別是全長mRNA和3’尾測序,研究表達量較低的RNA可以選擇smart的全長測序,而3’端測序可以得到更多的細胞,從而得到一個細胞群體的轉(zhuǎn)錄異質(zhì)性。
(2)spike-in control是常用的評估技術(shù)差異的方法, Lun et al.的研究發(fā)現(xiàn)spike-in control 在確定測序過程中的empty Wells和的dead cells有重要作用,因為高的ERCC含量與低質(zhì)量數(shù)據(jù)相關(guān),并且通常是排除的標(biāo)準(zhǔn)。
Spike-in:A molecule or a set of molecules introduced to the sample in order to calibrate measurements and account for technical variation; commonly used examples include external RNA control consortium (ERCC) controls (Ambion/Thermo Fisher Scientific) and Spike-in RNA variant control mixes。一個分子或一組分子引入到樣品中以校準(zhǔn)測量并解釋技術(shù)變化;常用的例子包括外部RNA控制聯(lián)合體(Ercc)和spike-in RNA變體控制混合物。
(3)10x捕獲到的細胞數(shù)量更多,實驗設(shè)計的不同會使文庫大小相差幾個數(shù)量級(Fig.1C,F)
(4)Smart-seq2 可以得到更多的基因信息(Fig.1G,D)
(5)Smart-seq2數(shù)據(jù)集比10x更復(fù)雜(Fig.1E,H)
總之,10x更加方便,簡少了人工操作,簡化了大量細胞的數(shù)據(jù)收集。但細胞數(shù)的增加導(dǎo)致測序深度也增加,犧牲了文庫的復(fù)雜度,丟失了固定的工作流程。
03
實驗設(shè)計
(1)避免技術(shù)偏差
成功的測序?qū)嶒炘O(shè)計 應(yīng)遵循三個原則:生物學(xué)重復(fù)、隨機分組和平衡區(qū)組設(shè)計(a balanced block design),見圖2.
在一個混雜的(confounded design)設(shè)計中,來自單個小鼠/條件組的細胞將被分揀到單個板上,并且該板上的細胞文庫將在一個批次中制備。最后,在一條lane中測序,而另一個條件下的文庫則在另一條lane中測序。在這個例子中,不可能分辨出基因表達的差異是因為實驗條件還是混雜的/不均衡的實驗設(shè)計引入的技術(shù)差異。這個實驗可以使用平衡組區(qū)重新設(shè)計,保證每個樣本的六個小鼠和測序儀的每一條lane都有樣本。
Smart-seq2 允許選擇individual wells填充細胞,很容易實現(xiàn)平衡組區(qū)的方法。對于10x,需要確保在初始封裝過程中處理不同芯片上的樣品,并進一步進行下游處理以平衡實驗。
(2)決定合適的細胞數(shù)目和測序深度
回收細胞數(shù)目可以根據(jù)樣本中所有細胞的預(yù)期異質(zhì)性、樣本內(nèi)特定細胞類型所期望的最小頻率和在所得到的數(shù)據(jù)集中期望的每種類型的細胞的最小數(shù)目來估計??梢岳秘摱椃植荚u估稀有樣本的細胞數(shù)目。例如,如果我們要測序好友10個細胞類型的樣本,但稀有細胞的頻率只有0.03,我們就需要對2200個細胞進行測序,以保證90%的機會捕獲到50個稀有細胞。一個實驗室:Satija lab,可以提供在線工具(www.satijalab.org/howmanycells),基于細胞類型和多樣性評估目標(biāo)細胞數(shù)目。
每個實驗的測序深度的準(zhǔn)確估計需要預(yù)知個體細胞中的總mRNA含量和這些細胞中mRNA物種的多樣性。但這些參數(shù)往往很難預(yù)估。在最近發(fā)表的研究中提供了一個有用的指導(dǎo)方針,他們用16個不同的protocol和五個物種進行了34個獨特實驗,對這些單細胞數(shù)據(jù)進行了全面的分析。他們發(fā)現(xiàn),每個細胞有250 000個reads就足夠準(zhǔn)確,每個細胞的100萬個讀取是飽和基因檢測的好目標(biāo)。但具體的測序深度因?qū)嶒炘O(shè)計差異和物種不同而做適當(dāng)調(diào)整。
END